package com.zhang.spark_1.spark_core.operator.transform

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

/**
 * @title:
 * @author: zhang
 * @date: 2021/12/5 18:51 
 */
object Spark07_RDD_Operator_Transform_Test7 {

  def main(args: Array[String]): Unit = {
    //获取spark的连接
    val conf: SparkConf = new SparkConf().setMaster("local[*]").setAppName("operator")
    val sc: SparkContext = new SparkContext(conf)
    //TODO filter 小功能：从服务器日志数据apache.log中获取2015年5月17日的请求路径

    val rdd: RDD[String] = sc.textFile("datas/apache.log")

   rdd.filter(
     line=>{
       val datas: Array[String] = line.split(" ")
       val time: Array[String] = datas(3).split(":")
       time(0).equals("17/05/2015")
     }
   ).collect().foreach(println)

    sc.stop()
  }
}
